草庐IT

python 反序列化

全部标签

python - 使用命名空间获取 lxml 标签属性

我的XML看起来像:......我有代码:fromlxmlimportetree...forterm_entryinroot.iterfind('.//termEntry'):printterm_entry.attrib['id']printterm_entry.nsmapforlang_setinterm_entry.iterfind('langSet'):printlang_set.nsmapprintlang_set.attribforsome_stuffinlang_set.iterfind('some_stuff'):...我得到空的nsmap字典,我的attrib字典看起来

python - 将 elementtree 转储到 xml 文件中

我用这样的东西创建了一个xml树top=Element('top')child=SubElement(top,'child')child.text='sometext'如何将其转储到XML文件中?我尝试了top.write(filename),但该方法不存在。 最佳答案 您需要实例化一个ElementTree反对并调用write()方法:importxml.etree.ElementTreeasETtop=ET.Element('top')child=ET.SubElement(top,'child')child.text='som

python - 清理 xml ==> 如果有空标签则删除行

我想清理我的xml,这样它不仅是有效的XML,而且以一种非常易于阅读的方式格式化。例如:Hello9.99我想删除所有带有空标签的行,留下:Hello9.99我尝试使用正则表达式执行此操作,但在以可读格式保留它方面运气不佳:txt=etree.tostring(self.xml_node,pretty_print=True)txt=re.sub(r'\n','',txt)完成上述任务的最佳方法是什么? 最佳答案 使用XML解析器。思路是findallemptynodes使用//*[not(node())]XPath表达式和remov

python - 解析包含默认命名空间的 xml 以使用 lxml 获取元素值

我有一个这样的xml字符串str1="""http://www.example.org/sitemap_1.xml.gz2015-07-01"""我想提取中存在的所有url节点即http://www.example.org/sitemap_1.xml.gz我试过这段代码,但没有字fromlxmlimportetreeroot=etree.fromstring(str1)urls=root.xpath("//loc/text()")printurls[]我试图检查我的根节点是否形成正确。我试过了,得到了与str1相同的字符串etree.tostring(root)'\n\nhttp://

python - 使用 Python 解析 XML 站点地图

我有这样的站点地图:http://www.site.co.uk/sitemap.xml其结构如下:http://www.site.co.uk/drag_it/dragitsitemap_static_0.xml2015-07-07http://www.site.co.uk/drag_it/dragitsitemap_alpha_0.xml2015-07-07...我想从中提取数据。首先我需要数一数有多少在xml中,然后为它们中的每一个提取和数据。有没有一种简单的方法可以在Python中执行此操作?我见过其他类似的问题,但它们都提取了例如每个xml中的元素,我需要从每个元素中单独提取数据

c# - XmlSerializer 序列化空变量以使用两个标签?

我希望能够将序列化的xml类加载到SoapEnvelope。我开始了,所以我没有填满内脏,所以它看起来像:我希望它看起来像:`我写的类是这样的:[System.SerializableAttribute()][System.Xml.Serialization.XmlTypeAttribute(AnonymousType=true,Namespace="http://schemas.xmlsoap.org/soap/envelope/")][System.Xml.Serialization.XmlRootAttribute(Namespace="http://schemas.xmlsoa

Python + 外籍人士 : Error on � entities

我写了一个小函数,它使用ElementTree和xpath来提取xml文件中某些元素的文本内容:#!/usr/bin/envpython2.5importdoctestfromxml.etreeimportElementTreefromStringIOimportStringIOdefparse_xml_etree(sin,xpath):"""TakesasinputastreamcontainingXMLandanXPathexpression.AppliestheXPathexpressiontotheXMLandreturnsageneratoryieldingthetextco

c# - 摆脱 C# XML 序列化中的数组名称

我试图在序列化XML时得到这个结果:Eldad1234或者换句话说-我试图在“根”元素中包含一个数组,以及其他键。这是我粗略的尝试:[XmlRootAttribute(ElementName="Root",IsNullable=false)]publicclassRootNode{[XmlAttribute("Name")]publicstringName{get;set;}publicstringSomeKey{get;set;}[XmlArrayItem("Element")]publicListElements{get;set;}}还有我的连载:stringresult;XmlS

c# - 从 XML 文件反序列化 int 数组

我正在编写一个C#项目,我正在尝试反序列化一个具有int[]类型字段的对象,我想以另一种方式进行反序列化。假设我有一个类:classPlayer{publicstringName;publicint[]Spells;}还有一个xml文件,我从中反序列化了类Player的一个实例:John159问题是我不希望xml文件看起来像那样,我希望它更像这样:John159我正在使用XmlSerializer并且它仅在读取表单第一个xml时才反序列化字段Spells。我想知道这是否是一种像简单字段一样反序列化int数组的方法。 最佳答案 其中一

xml - 如何在 Python 中以简单的方式拆分 XML 文件?

我有用于将XML文件解析为detailedhere的Python代码.我知道XML文件因在内存中操作时占用系统资源而臭名昭著。我的解决方案适用于较小的XML文件(比如200KB,而我有一个340MB的文件)。我开始研究StAX(拉式解析器)实现,但我的日程安排很紧,我正在寻找一种更简单的方法来完成这项任务。我了解创建较小的文件block,但我如何通过每次输出main/header标签来提取正确的元素?例如,这是模式:............................................如何为每1000个书籍元素创建包含标题数据的新XML文件?代码和数据集的具体例子可以